智能论文笔记

Wasserstein $K$-means for clustering probability distributions

Yubo Zhuang , Xiaohui Chen , Yun Yang

分类： (统计)机器学习 | 机器学习

2022-09-14

聚类是基于它们的相似性对组对象的重要探索性数据分析技术。广泛使用的$ k $ -MEANS聚类方法依赖于一些距离的概念将数据划分为较少数量的组。在欧几里得空间中，$ k $ -Means的基于质心和基于距离的公式相同。在现代机器学习应用中，数据通常是作为概率分布而出现的，并且可以使用最佳运输指标来处理测量值数据。由于瓦斯坦斯坦空间的非负亚历山德罗夫曲率，巴里中心遭受了规律性和非舒适性问题。 Wasserstein Barycenters的特殊行为可能使基于质心的配方无法代表集群内的数据点，而基于距离的$ K $ -MEANS方法及其半决赛计划（SDP）可以恢复真实的方法集群标签。在聚集高斯分布的特殊情况下，我们表明SDP放松的Wasserstein $ k $ - 金钱可以实现精确的恢复，因为这些集群按照$ 2 $ - WASSERSTEIN MERTRIC进行了良好的分离。我们的仿真和真实数据示例还表明，基于距离的$ K $ -Means可以比基于标准的基于质心的$ k $ -Means获得更好的分类性能，用于聚类概率分布和图像。

translated by 谷歌翻译

Automated assessment of disease severity of COVID-19 using artificial intelligence with synthetic chest CT

Mengqiu Liu , Ying Liu , Yidong Yang , Aiping Liu , Shana Li , Changbing Qu , Xiaohui Qiu , Yang Li , Weifu Lv , Peng Zhang

分类：计算机视觉

2021-12-11

背景：患者的分类是控制2019年冠状病毒疾病的大流行病（Covid-19），特别是在临床资源极为有限时在大流行的峰值期间。目的：开发一种用合成胸CT自动筛分和量化肺和肺炎病变的方法，并评估Covid-19患者的疾病严重程度。材料和方法：在本研究中，我们通过可用的数据集（来自“肺结核分析2016年”的285个数据集“来生成数据增强以产生合成胸CT图像。合成图像和掩模用于训练2D U-Net神经网络并在203个Covid-19数据集上测试，以产生肺和病变分段。疾病严重程度评分（DL：损伤负荷; DS：损伤得分）是基于分段计算的。使用Pearson方法评估DL / DS和临床实验室测试之间的相关性。 p值<0.05被认为是统计显着性。结果：将自动肺和病变分段与手动注释进行比较。对于肺部分割，骰子相似系数，Jaccard指数和平均表面距离的中值分别为98.56％，97.15％和0.49 mm。病变分割的相同度量分别为76.95％，62.54％和2.36毫米。在DL / DS和百分比淋巴细胞检测中发现显着（P << 0.05）相关性，R值分别为-0.561和-0.501。结论：基于胸部射线照相和数据增强的AI系统对Covid-19患者的肺癌和病变进行了分段。成像结果与临床实验室测试之间的相关性表明该系统的价值作为评估Covid-19疾病严重程度的潜在工具。

translated by 谷歌翻译

SemanticStyleGAN: Learning Compositional Generative Priors for Controllable Image Synthesis and Editing

Yichun Shi , Xiao Yang , Yangyue Wan , Xiaohui Shen

分类：计算机视觉

2021-12-04

最近的研究表明，风格老年提供了对图像合成和编辑的下游任务的有希望的现有模型。然而，由于样式盖的潜在代码被设计为控制全球样式，因此很难实现对合成图像的细粒度控制。我们提出了SemanticStylegan，其中发电机训练以分别培训局部语义部件，并以组成方式合成图像。不同局部部件的结构和纹理由相应的潜在码控制。实验结果表明，我们的模型在不同空间区域之间提供了强烈的解剖。当与为样式器设计的编辑方法结合使用时，它可以实现更细粒度的控制，以编辑合成或真实图像。该模型也可以通过传输学习扩展到其他域。因此，作为具有内置解剖学的通用先前模型，它可以促进基于GaN的应用的发展并实现更多潜在的下游任务。

translated by 谷歌翻译

Molecular Contrastive Learning with Chemical Element Knowledge Graph

Yin Fang , Qiang Zhang , Haihong Yang , Xiang Zhuang , Shumin Deng , Wen Zhang , Ming Qin , Zhuo Chen , Xiaohui Fan , Huajun Chen

分类：机器学习 | 人工智能

2021-12-01

分子表示学习有助于多个下游任务，例如分子性质预测和药物设计。为了适当地代表分子，图形对比学习是一个有前途的范式，因为它利用自我监督信号并没有人类注释要求。但是，先前的作品未能将基本域名知识纳入图表语义，因此忽略了具有共同属性的原子之间的相关性，但不通过键连接连接。为了解决这些问题，我们构建化学元素知识图（KG），总结元素之间的微观关联，并提出了一种用于分子代表学习的新颖知识增强的对比学习（KCL）框架。 KCL框架由三个模块组成。第一个模块，知识引导的图形增强，基于化学元素kg增强原始分子图。第二模块，知识意识的图形表示，利用用于原始分子图的公共曲线图编码器和通过神经网络（KMPNN）的知识感知消息来提取分子表示来编码增强分子图中的复杂信息。最终模块是一种对比目标，在那里我们在分子图的这两个视图之间最大化协议。广泛的实验表明，KCL获得了八个分子数据集上的最先进基线的优异性能。可视化实验适当地解释了在增强分子图中从原子和属性中了解的KCL。我们的代码和数据可用于补充材料。

translated by 谷歌翻译

Unsupervised COVID-19 Lesion Segmentation in CT Using Cycle Consistent Generative Adversarial Network

Chengyijue Fang , Yingao Liu , Mengqiu Liu , Xiaohui Qiu , Ying Liu , Yang Li , Jie Wen , Yidong Yang

分类：计算机视觉

2021-11-23

Covid-19已成为全球大流行，仍然对公众产生严重的健康风险。 CT扫描中肺炎病变的准确和有效的细分对于治疗决策至关重要。我们提出了一种使用循环一致生成的对冲网络（循环GaN）的新型无监督方法，其自动化和加速病变描绘过程。工作流程包括肺体积分割，“合成”健康肺一代，感染和健康的图像减法，以及二元病变面膜创造。首先使用预先训练的U-Net划定肺体积，并作为后续网络的输入。开发了循环GaN，以产生来自受感染的肺图像的合成的“健康”肺CT图像。之后，通过从“受感染的”肺CT图像中减去合成的“健康”肺CT图像来提取肺炎病变。然后将中值过滤器和K-Means聚类应用于轮廓的病变。在两个公共数据集（冠状遗传酶和Radiopedia）上验证了自动分割方法。骰子系数分别达到0.748和0.730，用于冠状遗传酶和RadioPedia数据集。同时，对冠纳卡酶数据集的病变分割性的精度和灵敏度为0.813和0.735，以及用于Radiopedia数据集的0.773和0.726。性能与现有的监督分割网络和以前无监督的特性相当。提出的无监督分割方法在自动Covid-19病变描绘中实现了高精度和效率。分割结果可以作为进一步手动修改的基线和病变诊断的质量保证工具。此外，由于其无人自化的性质，结果不受医师经验的影响，否则对监督方法至关重要。

translated by 谷歌翻译

Stable and Compact Face Recognition via Unlabeled Data Driven Sparse Representation-Based Classification

Xiaohui Yang , Zheng Wang , Huan Wu , Licheng Jiao , Yiming Xu , Haolin Chen

分类：计算机视觉

2021-11-04

基于稀疏的代表的分类（SRC）通过将识别问题作为简单的线性回归问题铸造了很多关注。然而，SRC方法仍然仅限于每类别的足够标记的样本，不充分使用未标记的样本，以及表示的不稳定性。为了解决这些问题，提出了一种未标记的数据驱动的逆投影伪全空间表示的基于空间表示的分类模型，具有低级稀疏约束。所提出的模型旨在挖掘所有可用数据的隐藏语义信息和内在结构信息，这适用于少量标记的样本和标记样本与正面识别中的未标记样本问题之间的比例不平衡。引入了混合的高斯Seidel和Jacobian Admm算法来解决模型。分析了模型的收敛性，表示能力和稳定性。在三个公共数据集上的实验表明，所提出的LR-S-PFSRC模型达到稳定的结果，特别是对于样品的比例不平衡。

translated by 谷歌翻译

Video Salient Object Detection via Contrastive Features and Attention Modules

Yi-Wen Chen , Xiaojie Jin , Xiaohui Shen , Ming-Hsuan Yang

分类：计算机视觉

2021-11-03

视频突出对象检测旨在在视频中找到最具视觉上的对象。为了探索时间依赖性，现有方法通常是恢复性的神经网络或光学流量。然而，这些方法需要高计算成本，并且往往会随着时间的推移积累不准确性。在本文中，我们提出了一种带有注意模块的网络，以学习视频突出物体检测的对比特征，而没有高计算时间建模技术。我们开发了非本地自我关注方案，以捕获视频帧中的全局信息。共注意配方用于结合低级和高级功能。我们进一步应用了对比学学习以改善来自相同视频的前景区域对的特征表示，并将前景 - 背景区域对被推除在潜在的空间中。帧内对比损失有助于将前景和背景特征分开，并且帧间的对比损失提高了时间的稠度。我们对多个基准数据集进行广泛的实验，用于视频突出对象检测和无监督的视频对象分割，并表明所提出的方法需要较少的计算，并且对最先进的方法进行有利地执行。

translated by 谷歌翻译

Omni-sparsity DNN: Fast Sparsity Optimization for On-Device Streaming E2E ASR via Supernet

Haichuan Yang , Yuan Shangguan , Dilin Wang , Meng Li , Pierce Chuang , Xiaohui Zhang , Ganesh Venkatesh , Ozlem Kalinli , Vikas Chandra

分类：自然语言处理

2021-10-15

从可穿戴设备到功能强大的智能设备，现代自动语音识别（ASR）型号在各种具有不同计算预算的边缘设备上运行。为了浏览模型准确性与模型大小的帕累托前线，研究人员陷入了通过为每个单独的边缘设备进行训练和微调模型来优化模型精度的困境，同时保持训练GPU小时可拖动。在本文中，我们提出了Omni-Sparsity DNN，其中可以修剪单个神经网络以生成针对各种模型大小的优化模型。我们为Omni-Sparsity DNN制定了培训策略，使其可以在Word-Error-rate（WER）vs模型大小的帕累托（Pareto）沿线找到模型，同时使培训GPU小时不超过训练一个单数模型的模型。我们使用流e2e ASR模型演示了Omni-Sparsity DNN。与单独修剪的稀疏型号相比，我们的结果在LibrisPeech上具有相似或更高准确性的培训时间和资源节省了大量节省：在测试中差2％-6.6％。

translated by 谷歌翻译

LightSeq2: Accelerated Training for Transformer-based Models on GPUs

Xiaohui Wang , Yang Wei , Ying Xiong , Guyue Huang , Xian Qian , Yufei Ding , Mingxuan Wang , Lei Li

分类：自然语言处理

2021-10-12

基于变压器的神经模型在许多AI应用中使用。培训这些模型很昂贵，因为它需要大量的GPU资源和较长的持续时间。这是具有挑战性的，因为诸如句子之类的典型数据具有可变的长度，而变压器的计算模式比卷积神经网络更为复杂。现有系统要么仅专注于模型推理，要么仅针对BERT样编码器模型进行优化。在本文中，我们提出了LightSeq2，该系统是为GPU上的一般变压器模型加速培训的系统。我们提出了一系列针对变压器模型的特定计算流量和内存访问模式量身定制的GPU优化技术。 LightSeq2支持许多模型体系结构，包括BERT（仅编码），GPT（仅解码器），变压器（编码器编码器）和视觉变压器。我们对各种模型和基准测试的实验表明，LightSeq2始终比不同GPU上的先前系统更快（1.4-3.5倍）。特别是，与大型公共机器翻译基准（WMT14英语 - 德国人）上的现有系统相比，它获得了308％的培训速度。

translated by 谷歌翻译

Adversarial Open Domain Adaptation for Sketch-to-Photo Synthesis

Xiaoyu Xiang , Ding Liu , Xiao Yang , Yiheng Zhu , Xiaohui Shen , Jan P. Allebach

分类：计算机视觉 | 人工智能

2021-04-12

在本文中，我们探索了开放式剪影到照片转换，旨在将备用素描与其类标签中的徒手素描合成，即使培训数据中缺少该类的草图。由于缺乏训练监督和写法草图和照片域之间的大几何扭曲，这是挑战性的。要从照片中综合缺少的手绘草图，我们提出了一个框架，共同学习素描到照片和照片到素描生成。然而，由于合成草图和真实的域间隙，从假草图训练的发电机可能导致缺失类的草图时导致不满意的结果。为了缓解这个问题，我们进一步提出了一种简单但有效的开放式采样和优化策略，以“愚弄”将发电机视为真实的草图。我们的方法利用了域名数据的学习素描到照片和照片到草图映射，并将其概括为开放式域类。我们在涂鸦和Sketchycoco数据集上验证我们的方法。与最近的竞争方法相比，我们的方法显示令人印象深刻的成果，在综合逼真的颜色，纹理和维护各类开放式域草图的几何组合物方面。我们的代码可在https://github.com/mukosame/aoda获得

translated by 谷歌翻译